|
ランダムフォレスト()は、2001年に Leo Breiman によって提案された機械学習のアルゴリズムであり、分類、回帰、クラスタリングに用いられる。決定木を弱学習器とする集団学習アルゴリズムであり、この名称は、ランダムサンプリングされたトレーニングデータによって学習した多数の決定木を使用することによる。対象によっては、同じく集団学習を用いるブースティングよりも有効とされる。 == アルゴリズム == === 学習 === # 学習を行いたい観測データから、ランダムサンプリングによりB組のサブサンプルを生成する(ブートストラップサンプル) # 各サブサンプルをトレーニングデータとし、''B'' 本の決定木を作成する # 指定したノード数 に達するまで、以下の方法でノードを作成する ## トレーニングデータの説明変数のうち、''m'' 個をランダムに選択する ## 選ばれた説明変数のうち、トレーニングデータを最も良く分類するものとそのときの閾値を用いて、ノードのスプリット関数を決定する 要点は、ランダムサンプリングされたトレーニングデータとランダムに選択された説明変数を用いることにより、相関の低い決定木群を作成すること。 パラメータの推奨値 * : 分類の場合は1、回帰の場合は5 * ''m'': 説明変数の総数を''p''とすると、分類の場合は、回帰の場合は ''p/3'' 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「ランダムフォレスト」の詳細全文を読む スポンサード リンク
|